由于硬件故障而更换节点

如果节点发生故障,那么可从集群移除节点并在新节点上安装 IBM Spectrum Virtualize for Public Cloud 软件。

由于您无权使用 IBM Spectrum Virtualize for Public Cloud 直接访问硬件,所以在节点发生故障时,您可以使用以下两个选项。
  • 如果可以快速修复硬件故障,请等到硬件修复完毕再重新启动节点。有关重新启动节点的更多信息,请参阅管理节点
  • 对于 IBM Cloud™ 环境中的 IBM Spectrum Virtualize for Public Cloud 软件,订购另一个节点以更换发生故障的节点。通过执行与从两个节点扩展到四个节点时所执行步骤类似的步骤,将节点添加到现有集群。有关更多信息,请参阅由 2 个节点扩展为 4 个、6 个或 8 个节点
  • 对于 Amazon Web Services (AWS) 环境中的 IBM Spectrum Virtualize for Public Cloud 软件,请完成以下步骤:
    1. 使用 AWS 缺省管理员概要文件登录到 AWS 管理控制台
    2. 创建新的临时堆栈。除堆栈名称之外的所有参数都必须与现有堆栈的参数相同。
    3. 登录到临时集群的命令行界面并准备候选节点。
      1. 使用以下命令检查代码级别是否与现有集群相同:lssystem | grep code
      2. 从临时集群中除去一个节点,然后输入以下命令:rmnode node_id,其中 node_id 是新节点的标识。
      3. 通过使用以下命令来验证所移除节点的 node_status 是否为 candidatesainfo lsservicenodes
    4. 在新节点中配置节点发现:
      1. 登录至集群的工作节点并使用以下命令来检索节点 IP:sainfo lsnodeip
      2. 登录至新节点,并为通过 lsnodeip 命令列出的每个节点 IP 添加发现子网:satask addnodediscoverysubnet -net [node_IP_address]/32
    5. 在集群的工作节点中配置节点发现。
      1. 登录至新节点并使用以下命令来检索节点 IP:sainfo lsnodeip
      2. 登录至新节点,并为通过 lsnodeip 命令列出的每个节点 IP 添加发现子网:satask addnodediscoverysubnet -net [node_IP_address]/32
      3. 等待 2 分钟,然后运行以下命令以查看显示的新节点:sainfo lsservicenode
    6. 从命令行界面,输入以下命令以从集群中移除故障节点:rmnode node_id,其中 node_id 是有故障节点的标识。
    7. 从命令行界面,输入以下命令以将新节点添加到现有集群:addnode -iogrp 0 -panelname new_node_panel_name,其中 new_node_panel_name 是新节点的面板名称。
    8. 重新部署定额应用程序。
    9. 从 AWS 控制台,删除任何不需要的 EC2 资源:
      1. 终止故障节点的 EC2 实例。
      2. 终止临时堆栈中的其他两个 EC2 实例。
      3. 移除临时堆栈创建的 EBS 磁盘。